Datos observados entre UK y España
A continuacón mostramos una representación interactiva entre el historial de casos / fallecimientos por Covid-19 entre UK y España.
La importancia de esta visualización, es para ver el crecimiento de casos y fallecimientos durante la pandemia, y además ver si las medidas de confinamiento implementados por los gobiernos de ambos paises, han tenido efecto para frenar la curva de crecimiento.
Aunque es cierto que la evolución del virus es diferente entre ambos países, debido a que UK lleva un retraso respecto a España, la gran diferencia entre los dos países, es el tipo de confinamiento que implementó cada país.
España: 15 marzo, España en respuesta a la alarmante número creciente de casos de Covid-19, declaró Estado de Alarma, y en consecuencia, unas medidas de control, entre ellas, el confinamiento. Unas medidas implementadas de carácter Dura, lo cual significaba diversas sanciones económicas y posiblemente penales, si se incumple las medidas.
UK: 23 marzo, UK con retraso respecto a otros países europeos, implementa también unas medidas de confinamiento para los ciudadanos británicos. A diferencia de España, las medidas son Laxas. El modelo liberal de confinamiento que rige en Reino Unido, es diferente respecto a sus vecinos europeos, ya que el gobierno británico permite actividades que son prohibidas en muchos paises. El estilo liberal clásico de los británicos, hizo que las restricciones se impusieran más tarde, y sean además mucho más leves, y por eso, hay predicciones que pronostican que tendrá por tanto el mayor número de víctimas de toda Europa.
Esto se puede observar en las tablas a continuación, donde el pico de datos observados en UK todavía es creciente de forma alarmante, y no tiene previsión de suavizar pronto, algo que se puede apreciar en la tabla de casos acumulados de España, donde ya observamos que la curva esta empezando a suavizarse y quizá significa que lo peor ya ha pasado, y podemos comenzar a pensar en la segunda fase, unas medidas de desaceleración de confinamiento,
En esta pestaña tenemos una representación interactiva de los nuevos casos diarios confirmados de UK y España.
Esta tabla resulta muy útil para entender los datos, por diversos motivos:
En resumen, podemos observar claramente que debido al modelo de actuación tradicional liberal de UK, es aún creciente la curva, mientras que España, su modelo duro ha conseguido disminuir los nuevos casos diarios, y tomar mas el control. Cabe destacar que entre los días 14-22 abril, en España hemos notado subidas fuertes debido al aumento de tests rápidos, no quiere decir que España como país ha bajado el esfuerzo en controlar el virus en la península.
ARIMA
Para la asignatura de Procesos Estocásticos impartida por el profesor Francisco Morillas, hemos realizado un estudio que consitia en realizar una serie de predicciones sobre una variable relacionada con el COVID-19. El objetivo de este proyecto es estudiar los comportamientos que muestran diferentes variables, como por ejemplo casos confirmados o fallecimientos a lo largo del tiempo. Utilizamos ARIMA, que en estadística, econometría, estocásticos y en particular en el análisis de series temporales, un modelo de promedio móvil integrado autorregresivo (ARIMA) es una generalización de un modelo de promedio móvil autorregresivo (ARMA).
Ambos modelos se ajustan a los datos de las series cronológicas ya sea para comprender mejor los datos o para predecir los puntos futuros de la serie (pronóstico). Los modelos ARIMA se aplican en algunos casos en que los datos muestran evidencia de no estacionalidad, en los que se puede aplicar una o más veces un paso inicial de diferenciación (correspondiente a la parte “integrada” del modelo) para eliminar la no estacionalidad.
La parte AR de ARIMA indica que la variable de interés en evolución está retrocedida en sus propios valores retardados (es decir, anteriores). La parte MA indica que el error de regresión es en realidad una combinación lineal de términos de error cuyos valores se produjeron contemporáneamente y en varios momentos del pasado. La I (por “integrado”) indica que los valores de los datos han sido sustituidos por la diferencia entre sus valores y los valores anteriores (y este proceso de diferenciación puede haberse realizado más de una vez). El propósito de cada una de estas características es hacer que el modelo se ajuste lo mejor posible a los datos.
Los modelos ARIMA no estacionales se denominan generalmente ARIMA(p,d,q) donde los parámetros p, d y q son números enteros no negativos, p es el orden (número de intervalos de tiempo) del modelo autorregresivo, d es el grado de diferenciación (el número de veces que se han restado valores anteriores a los datos), y q es el orden del modelo de promedio móvil. Los modelos ARIMA estacionales suelen denominarse ARIMA(p,d,q)(P,D,Q)m, donde m se refiere al número de períodos de cada estación, y las mayúsculas P,D,Q se refieren a los términos autorregresivo, de diferenciación y de promedio móvil para la parte estacional del modelo ARIMA.
Cuando dos de los tres términos son ceros, se puede hacer referencia al modelo en base al parámetro no cero, eliminando “AR”, “I” o “MA” de la sigla que describe el modelo. Por ejemplo, ARIMA (1,0,0) es AR(1), ARIMA(0,1,0) es I(1), y ARIMA(0,0,1) es MA(1). Los modelos ARIMA pueden estimarse siguiendo el enfoque de Box-Jenkins.
Optamos por realizar nuestro estudio sobre el caso de Reino Unido, con la idea de además de realizar las predicciones, poder contrastar con el caso de España, debido al retraso que lleva Reino Unido respecto a España en el virus.
Elegimos realizar predicciones sobre la cantidad de fallecimientos acumulados durante 3 días.
Fue necesario calibrar uno o dos modelos de tipo ARIMA. Validarlo y luego lo testearlo.
Aplicamos un modelo ARIMA con valores en p,d,q de 4,1,0.
Los errores en las estimaciones fueron los siguientes:
Los errores entre el valor observado y lo esperado en la predicción tuvo un rango entre 0-1,30%
Esta pestaña permite una visualización de los casos a escala mundial.
Información importante
Coronavirus Dashbord para el caso de United Kingdom: Realizado por Cameron Tough y Diego Laorden para la asignatura de procesos estócasticos, en relación a una tarea de clase para estudiar como podemos realizar predicciones con series temporales mediante un ajuste de ARIMA alumnos de ciencias actuariales de la Universidad de Valencia.
En primer lugar dar las gracias a Rami Krispin, por darme autorización para hacer uso de su repositorio como base de datos. Los datos de entrada de este tablero son los disponibles en el Paquete R.
Los datos en bruto son extraídos del Centro de Ciencia e Ingeniería de Sistemas de la Universidad John Hopkins (JHU CCSE) Coronavirus.
Los datos específicos de UK son extraidos de: (https://www.gov.uk/government/publications/covid-19-track-coronavirus-cases)
Asegúrate de descargar la versión de desarrollo del paquete para tener los últimos datos.
Este Coronavirus dashboard: el caso de Reino Unido proporciona una visión general de la epidemia de Coronavirus COVID-19 (2019-nCoV) de 2019 para Reino Unido. Este dashboard fue construido con R usando el marco de trabajo de R Markdown.
Librerias necesarias
install.packages("devtools")
install_github("RamiKrispin/coronavirus")
* Dashboard interfaz - Paquete [flexdashboard](https://rmarkdown.rstudio.com/flexdashboard/)
* Visualización - the [plotly](https://plot.ly/r/) paquete para plots y [leaflet](https://rstudio.github.io/leaflet/) para el mapa.
* Data manipulación - [dplyr](https://dplyr.tidyverse.org/), y [tidyr](https://tidyr.tidyverse.org/)
* Tablas - [DT](https://rstudio.github.io/DT/) paquete R.
Ejecutando el fichero, con el paquete estadístico de R-Studio actualiza los datos diariamente.